Spark Streaming实时计算框架介绍 随着大数据的发展,人们对大数据的处理要求也越来越高,原有的批处理框架MapReduce适合离线计算,却无法满足实时性要求较高的业务,如实 ...
Spark Streaming实时计算框架介绍 随着大数据的发展,人们对大数据的处理要求也越来越高,原有的批处理框架MapReduce适合离线计算,却无法满足实时性要求较高的业务,如实 ...
Kafka与Logstash的数据采集 基于Logstash跑通Kafka还是需要注意很多东西,最重要的就是理解Kafka的原理。 Logstash工作原理 由于Kafk ...
Elasticsearch索引mapping的写入、查看与修改 https://blog.csdn.net/napoay/article/details/52012249 首先创建一个索引: c ...
大数据平台的数据采集 数据采集的设计,几乎完全取决于数据源的特性,毕竟数据源是整个大数据平台蓄水的上游,数据采集不过是获取水源的管道罢了。 在数据仓库的语境下,ETL基本上就是数据采集的代 ...
日志收集之kafka http://www.jianshu.com/p/f78b773ddde5 一、介绍 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下: 以 ...
Elasticsearch 的坑爹事——记录一次mapping field修改过程 http://www.cnblogs.com/Creator/p/3722408.html Elasticsea ...
windows 64 curl 命令的使用 https://blog.csdn.net/qq_27093465/article/details/53545693 curl命令可以通过命令行的方式, ...
Kafka是分布式发布-订阅消息系统 https://www.biaodianfu.com/kafka.html Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为A ...
隐马尔可夫模型(HMM) 原文地址:http://www.cnblogs.com/jacklu/p/7753471.html 本文结合了王晓刚老师的ENGG 5202 Patte ...
SPARK如何使用AKKA实现进程、节点通信 《深入理解Spark:核心思想与源码分析》一书前言的内容请看链接《深入理解SPARK:核心思想与源码分析》一书正式出版上市 《深入理解Spar ...